最近的研究表明,自然语言理解中的系统概括仍然是最先进的神经模型(如变形金刚和图形神经网络)的挑战。为了解决这一挑战,我们提出了边缘变压器,这是一种新的模型,将灵感与基于规则的符号AI结合起来。边缘变压器中的第一个关键思想是将矢量状态与每个边缘相关联,即使用每对输入节点 - 与每个节点相对,因为它在变压器模型中完成。第二重要创新是一个三角形关注机制,以通过从逻辑编程的统一启发的方式更新边缘表示。我们在关系推理,语义解析和依赖性解析中评估边缘变压器上的成分泛化基准。在所有三种设置中,边缘变压器优于关系感知,通用和古典变压器基线。
translated by 谷歌翻译
Neural machine translation is a relatively new approach to statistical machine translation based purely on neural networks. The neural machine translation models often consist of an encoder and a decoder. The encoder extracts a fixed-length representation from a variable-length input sentence, and the decoder generates a correct translation from this representation. In this paper, we focus on analyzing the properties of the neural machine translation using two models; RNN Encoder-Decoder and a newly proposed gated recursive convolutional neural network. We show that the neural machine translation performs relatively well on short sentences without unknown words, but its performance degrades rapidly as the length of the sentence and the number of unknown words increase. Furthermore, we find that the proposed gated recursive convolutional network learns a grammatical structure of a sentence automatically.
translated by 谷歌翻译
Neural machine translation is a recently proposed approach to machine translation. Unlike the traditional statistical machine translation, the neural machine translation aims at building a single neural network that can be jointly tuned to maximize the translation performance. The models proposed recently for neural machine translation often belong to a family of encoder-decoders and encode a source sentence into a fixed-length vector from which a decoder generates a translation. In this paper, we conjecture that the use of a fixed-length vector is a bottleneck in improving the performance of this basic encoder-decoder architecture, and propose to extend this by allowing a model to automatically (soft-)search for parts of a source sentence that are relevant to predicting a target word, without having to form these parts as a hard segment explicitly. With this new approach, we achieve a translation performance comparable to the existing state-of-the-art phrase-based system on the task of English-to-French translation. Furthermore, qualitative analysis reveals that the (soft-)alignments found by the model agree well with our intuition.
translated by 谷歌翻译
In this paper, we propose a novel neural network model called RNN Encoder-Decoder that consists of two recurrent neural networks (RNN). One RNN encodes a sequence of symbols into a fixedlength vector representation, and the other decodes the representation into another sequence of symbols. The encoder and decoder of the proposed model are jointly trained to maximize the conditional probability of a target sequence given a source sequence. The performance of a statistical machine translation system is empirically found to improve by using the conditional probabilities of phrase pairs computed by the RNN Encoder-Decoder as an additional feature in the existing log-linear model. Qualitatively, we show that the proposed model learns a semantically and syntactically meaningful representation of linguistic phrases.
translated by 谷歌翻译
为了在高移动性虚拟环境中实现柔软物体的高富度触觉渲染,我们提出了一种新颖的触觉显示dandeliontouch。一群无人机将触觉执行器传递给用户的指尖。 DandelionTouch的用户能够在不受设备工作区域限制的大空间中体验触觉反馈。重要的是,在与虚拟物体的长时间互动中,他们不会经历肌肉疲劳。手动跟踪和群控制算法允许用手动运动引导群,并避免在编队内部发生冲突。在这项研究中,研究了群体之间的阻抗连接的几种拓扑结构。该实验在实时在正方形轨迹上执行了一个遵循的实验,该实验表明,在恒星拓扑中连接的无人机执行了平均位置误差较低的轨迹(与其他阻抗拓扑相比,RMSE降低了20.6 \%与潜在的基于现场的群体控制相比,为40.9 \%。在所有具有阻抗行为的地层中,无人机的达到的速度比通过潜在场算法控制的群体高28%。此外,在与7名参与者的用户研究中评估了几种纤维骨架模式的感知。该研究表明,提议的时间延迟和频率调制的组合使用户可以同时成功识别VR中的表面特性和运动方向(平均识别率为70 \%,最大为93 \%)。 DandelionTouch建议在VR系统中提出一种新型的触觉反馈,无需手持或可穿戴界面。
translated by 谷歌翻译
由于其在崎rough的地形中的高机动性和遍历性,四倍的平台已成为一个积极的研究主题。但是,确定机器人是否可以通过裂缝环境以及如何准确计算其路径是高度挑战。此外,计算出的路径可能会穿过具有动态物体或环境对机器人或周围人危险的区域。因此,我们提出了一种新颖的概念方法,即通过虚拟现实(VR)中的用户指导路径计划进行教学四倍的机器人导航。我们的系统包含全球和本地路径计划者,使机器人可以通过学习的迭代来生成路径。 VR接口允许用户与环境进行交互,并在具有挑战性的情况下协助四足机器人。比较实验的结果表明,人与路径计划算法之间的合作可以使算法的计算速度平均增加35.58%,并且在测试方案中,路径长度(平均6.66%)的非急剧增加。此外,用户将VR接口描述为不需要物理需求(10中的2.3),并高度评估了其性能(10中的7.1分)。寻找不太最佳但更安全的路径的能力仍然需要在混乱和非结构化的环境中导航的任务。
translated by 谷歌翻译
如今,自动移动机器人为人类存在多余或太危险的许多地区提供支持。他们在探险,天然气行业,矿山,仓库等中成功证明了自己。但是,即使是腿部的机器人也可能陷入困境的地形条件下,需要人类的认知能力来浏览该系统。尽管游戏手柄和键盘方便用于轮式机器人控制,但3D空间中的四足机器人可以沿所有线性坐标和欧拉角移动,需要至少12个按钮才能独立控制其DOF。因此,需要更方便的控制接口。在本文中,我们介绍了超大型:一种与四足机器人直观的人类机器人相互作用的新型手势界面。如果没有其他设备,操作员可以通过手势识别识别3D空间中的四倍机器人的完全位置和方向控制,只有5个手势和6个DOF手动运动。实验结果表明,将5个静态手势分类为高精度(96.5%),可以准确预测手在三维空间中手的6D位置的位置。所提出的方法的绝对线性偏离根均方根偏差(RMSD)为11.7毫米,比第二个测试方法低50%,所建议方法的绝对角度偏差RMSD为2.6度,几乎为27%低于第二个测试方法。此外,进行了用户研究,以探索用户通过建议的手势接口从人类机器人交互中的主观体验。参与者将其与超级方面的互动评估为直观(2.0),不会引起挫败感(2.63),并且需要较低的身体需求(2.0)。
translated by 谷歌翻译
由于长期机器人操作中的地图尺寸的增长,现有的同时定位和映射方法的可伸缩性受到限制。此外,处理此类地图进行本地化和计划任务会导致船上所需的计算资源增加。为了解决长期操作中记忆消耗的问题,我们开发了一种新型的实时SLAM算法,即Meslam,该算法基于神经场隐含的地图表示。它结合了提出的全球映射策略,包括神经网络分布和区域跟踪,以及外部进程系统。结果,该算法能够有效地训练多个代表不同地图区域的网络,并在大规模环境中准确地训练姿势。实验结果表明,所提出的方法的准确性与最新方法(平均为6.6 cm的TUM RGB-D序列)相当,并且优于基线,IMAP $^*$。此外,拟议的SLAM方法提供了最紧凑的地图,而没有细节变形(1.9 MB(1.9 MB)在最先进的大满贯方法中储存57 m $^3 $)。
translated by 谷歌翻译
如今,腿部四足机器人的设计和开发是科学研究的一个非常活跃的领域。实际上,由于与其他移动机器人相比,腿部机器人能够适应严峻的地形和各种环境条件,因此变得流行。随着对腿部机器人实验的需求较高,更多的研究和工程师需要一种负担得起,快速的运动算法开发方式。在本文中,我们提出了一个新的开源四倍的机器人超狗平台,该平台具有12个RC伺服电机,NVIDIA JETSON NANO COMPUTER和STM32F4 DISCOVERY板。 HyperDog是四倍的机器人软件开发的开源平台,该平台基于机器人操作系统2(ROS2)和Micro-Ros。此外,HyperDog是完全由3D印刷零件和碳纤维建造的四倍的机器人狗,它使机器人的重量轻和强度良好。这项工作的想法是证明机器人开发的一种负担得起且可定制的方式,并为研究和工程师提供了腿部机器人平台,在该平台中可以在模拟和真实环境中测试和验证不同的算法。具有代码的开发项目可在GitHub(https://github.com/ndhana94/hyperdog_ros2)上获得。
translated by 谷歌翻译
在拟议的研究中,我们描述了一种方法,可通过在摄像机和猛击管道之间实现中间层来提高具有多个相机的移动机器人的视觉猛击算法和有限的计算能力的方法。在此层中,图像是使用基于RESNET18的神经网络对机器人定位的适用性进行分类的。该网络接受了在Skolkovo科学技术学院(Skoltech)校园收集的六摄像机数据集培训。对于训练,我们使用与随后的同一相机(“良好”关键点或功能)成功匹配的图像和球形功能。结果表明,网络能够准确地确定Orb-Slam2的最佳图像,并在SLAM管道中实施拟议的方法可以显着增加SLAM算法可以定位的图像数量,并提高其整体鲁棒性,并提高其整体鲁棒性。视觉大满贯。与使用Orb提取器和在CPU操作时使用Orb提取器和功能匹配器相比,操作时间的实验表明,在GPU上运行时,提出的方法的速度至少要快6倍。该网络评估在识别具有大量“良好” ORB关键的图像时至少显示了90%的精度。提出的方法的使用允许通过从具有贫困流的相机切换来保持整个数据集的大量功能。
translated by 谷歌翻译